ขอบเขตของการอนุมาน
การอนุมานทางสถิติเกี่ยวข้องกับการสร้างข้อความเกี่ยวกับลักษณะของมาตรการความน่าจะเป็นที่แท้จริงและซ่อนเร้น มันใช้ข้อมูลที่สังเกตได้เพื่อจำกัดว่าการแจกแจงใด (หรือครอบครัวของการแจกแจง) ที่ก่อให้เกิดความแปรปรวนที่เราเห็น ไม่ว่าเราจะประมาณพารามิเตอร์ $s$ หรือคาดการณ์ค่า $X$ ในอนาคต เราต่างพยายามคลี่คลายความคลุมเครือของแหล่งที่มา
ความสัมพันธ์ระหว่างการอธิบายและการอนุมาน
แม้ว่ามักมองว่าเป็นเพียงสรุปง่ายๆ แต่วิธีการอย่างการคำนวณค่าเฉลี่ยตัวอย่าง $\bar{x}$ จริงๆ แล้วเป็นขั้นตอนแรกของการอนุมานตำแหน่งของความหนาแน่นประชากรที่แท้จริง
ตัวอย่าง: งานวิจัยปลูกถ่ายหัวใจที่มหาวิทยาลัยสแตนฟอร์ด (5.1.1)
ในงานวิจัยพื้นฐานโดยทัลบูร์น บราวน์ และฮู (1974) นักวิจัยตรวจสอบว่าโครงการปลูกถ่ายหัวใจที่สแตนฟอร์ดสามารถ "สร้างผลลัพธ์ตามที่ตั้งใจ" (เพิ่มอัตราการอยู่รอด) หรือไม่ การดูเวลาอยู่รอดดิจิทัล ($X$) ของผู้ป่วยเพียงคนเดียวหรือสองคนนั้นไม่เพียงพอ
- กลุ่มควบคุม: ผู้ป่วยที่ได้รับการดูแลมาตรฐาน
- กลุ่มรักษา: ผู้ป่วยที่ได้รับการปลูกถ่าย
นักวิจัยต้องใช้การอนุมานเพื่อตัดสินว่าความแตกต่างในการอยู่รอดมีนัยสำคัญทางสถิติหรือเป็นเพียงผลจาก การเปลี่ยนแปลงแบบสุ่ม ที่ซ่อนอยู่ในสุขภาพของผู้ป่วยแต่ละราย
ธรรมชาติสองด้านของความไม่แน่นอน
เราต้องยอมรับข้อผิดพลาดที่สำคัญในการวิเคราะห์—ความไม่แน่นอนไม่ใช่เสียงรบกวนแบบเดียว แต่เกิดจากแหล่งที่มาที่แตกต่างกันสองประการ:
- การเปลี่ยนแปลงที่เกิดจากตัวเอง: ถูกจำลองโดยความน่าจะเป็น (เช่น ความสุ่มของการโยนเหรียญหรือความหลากหลายทางชีวภาพ)
- ความไม่รู้ในโครงสร้าง: ความจริงที่ว่าเราไม่สามารถเก็บข้อมูลเพียงพอเพื่อรู้โมเดลความน่าจะเป็นที่ถูกต้องได้อย่างแม่นยำที่สุด